【增长黑客】微软 Power BI 创建 AARRR 报表之新增获客
文章来自天善智能大数据社区 www.hellobi.com 博客专栏 PivotModel。欢迎更多在大数据、数据分析、数据挖掘和商业智能 BI 领域的一线技术爱好者、咨询顾问、CTO等加入 www.hellobi.com 社区,开启您的个人博客专栏,共同推动大数据行业和技术的进步。
从2016年开始,微软BI 就跻身 Garnter 商务智能与分析魔力象限的领导者位置,和 Tableau,Qlik 同列三甲之位。
对于 Tableau,Qlik 这两款敏捷BI工具,大家自然不陌生。而在微软BI产品线当中,去年夏天推出的 Power BI 是款独立的端到端敏捷BI工具。
毫无疑问,Power BI 将成为一款大众化的可视化分析工具。那么在掌握并应用工具之前,应避免为了掌握工具而掌握工具,为了分析而开展分析,就收集数据马上开始入手的情况。首先还是要回答以下问题:
为什么要开展分析?
简单来说,数据分析是为了公司的发展,直接点,就是盈利、以及长期不断的持续地盈利。
数据分析不是为了分析而分析,更不是为了创建炫酷的图表而追逐新的工具,或炫耀钻研更生僻的技术。因为在你的分析成果被接纳用于支撑决策并最终产生行动带来效益之前,你的分析丝毫没有变现获取价值。
那么问题来了:
What:要分析哪些数据?
How:怎样分析数据?
Value:对这些数据开展分析,都能带来哪些价值?
只有以终为始,从价值出发,逆向思考,才能开展有价值的分析:所谓价值,就是收入,减去投入/成本,然后再用风险系数进行调整得到的。
比如,通常衡量企业盈利能力的一个核心指标,是利润率,那么利润率如何?可以同行业平均、其他二级公司进行比较。也可以将利润拆解,简单来说,就是“利润=收入-成本”。
与收入相关的数据分析有哪些?
与成本相关的数据分析有哪些?
对持续盈利性产生影响波动的风险因素相关的数据又有哪些?
例如,增加收入的来源有哪些?我们可以建立一个指标树,对收入指标进行拆解,就会发现新增用户流量、或者新增客户通常是收入增长的一项主要来源? 那么,接下来,需要哪些指标来衡量新增客户的速度、质量?要从哪些角度开展分析?维度和度量有哪些?要构造怎样的多维数据模型?获取哪些数据?这一系列问题就很清楚了。
增长黑客的 AARRR 海盗指标体系
对于数据分析师而言,AARRR 海盗指标体系就是一个必备的分析工具。
那么,何为AARRR?
所谓 AARRR 海盗指标体系,也称 AARRR 用户模型,其实就是“获取(Acquisition)”、“激活(Activation)”、“留存(Retention)”、“传播(Referral)”、“收入(Revenue)”
最后的 Revenue 是指要最终带来收入的用户,也就是客户。因此简化的 AARRR 可以看作是客户分析的一个核心体系。
以收入为导向的客户分析,都能带来哪些好处呢?
可以更加了解客户:懂得客户为什么来,为什么走,为什么活跃,为什么留存;
采取不同的措施:对于新客户增长,对于已有客户活跃和留存,活跃用户促付费,流失用户挽回都有应对措施。
建立长期良性循环的机制:通过机制让已购买已付费的客户持续购买付费。
AARRR 之客户获取(Acquisition)
衡量拉新/获客的重要指标:
【新增客户数】
【客户增长率】
【获客成本】
等等
影响拉新/获客的重要因素:
提供的产品或服务。哪些产品,对于客户而言更具吸引力?
提供服务的机构/地理位置。哪些地区的客户售前服务能力更高?
获客(Acquisition)的数据问题
有关获客分析,新手通常应当避免的错误是:
误把每期新增客户数当成是当期客户数。也就是说,本期新增客户数 ≠ 本期客户数
误把每期客户数简单地累计相加。也就是说,本年度的客户数 ≠ 连续12个月,每个月份的客户数简单相加。
误把 【客户增长率】当成客户环比增长率。也就是说,【客户增长率】 ≠ 【环比增长率】,环比增长率强调的是本期客户数与上期客户数的比较,但获客分析中关注的是新增客户的增长情况。
不考虑 【获客成本】。通常获取一个新客户,是维系一个老客户成本的6-12倍。获客时的边际成本高于所获客户的价值时,这时候的获客带来的价值实际上为负的。有关获客成本后续连载时我们会详细阐述。
那么什么是客户?
通常,在交易记录中,只要曾经发生过交易,也就是说发生过购买行为的交易对手,就是客户。当然有些时候为了强调区分,称为“已购买客户”。当然,成为客户之前,未购买的状态下通常成为用户、访客等等。当然也有一种情况,就是先成为会员,再获得购买的权利。比如公司楼下食堂餐厅,你的先办会员卡充值,才能消费。
如何得到客户数?
所有的交易记录中,都有客户编码。只要对交易记录中的客户编码,进行非重复计数,即可得到客户数。对某个时间期间、某个筛选条件的客户数据进行筛选,会得到满足相应条件的客户数,比如得到每期客户数。
除了每期客户数以外,我们还关注本期虽没有参与交易,但历史上曾参与交易的客户总数,也就是截止至某期期末客户数,是从一开始到该期期末,发生交易的客户数,也称为LTD (Life-to-Date) 客户数。
如何计算【新增客户数】?
在我们绕开那些获客指标计算中的坑之后,计算【新增客户数】、【客户增长率】就容易很多。
对于某期的新增客户而言,有:
本期【新增客户数】=期末客户数-期初客户数
如果这个公式没想明白,那么以下公式也是等效的:
本期【新增客户数】=本期客户数-上期客户数
这里的本期客户数,默认的是本期最后一天,也就是本期期末客户数;上期客户数是上期期末客户数,也就是等同于本期期初客户数。所有客户数的计算,都是采用LTD(Life-to-Date)方式计算得到的。
如何计算期初客户数/期末客户数?
截止至本期期末(LTD)计算模式,也成为 LTD(Life-To-Date)计算。
如果你听说过 YTD\QTD\MTD 年初至今\季初至今\月初至今,那么 LTD 也非常类似。
我们用 Power BI 中的交互式可视化图表,可以清楚地表达出来:
柱状图中红色的数据系列,就是新增客户数。我们以每个季度为一期。新增客户数就是两个季度期间 LTD 客户数的差异。
也就是说:
本期新增客户数=本期末客户数-上期末客户数=本期末客户数-本期初客户数
本期末客户数=新增客户数+老(回头)客户数+流失客户数。
本期初客户数=老(回头)客户数+流失客户数。
本期活跃客户数=新增客户数+老(回头)客户数。
使用 Power BI 中,使用“产品类别”,或者“区域”作为分析维度,可以进行交叉筛选查看。
Power BI 中可视化分析中的指标和维度选取决策
思考:【新增客户数】越多越好么?
该指标反映的是客户获取/拉新的数量。但很多时候不能仅考虑客户数量,更多地考虑新增客户带来的收益,以及获客成本,和新增客户数大起大落带来的风险。
(1)获客收益有多高?新增的客户会重复购买么?可以追加/交叉销售么?
(2)获客成本有多高?获取一个新客户的成本,通常是老客户的6倍。
(3)新增客户数的大起大落带来哪些风险?产品供不应求势必要增加产能,扩充更多服务人手,突变大流量很快能把服务器搞垮。产能扩充投资和后续闲置、员工加班带来的满意度下降,客户体验下降。
因此,除了新增客户数以外,还需要考虑客户增长爆发度和衰减度等加速度指标、考虑获客成本、客户终身价值(LTD)等指标,我们在博客中会进行后续连载。
影响【新增客户数】的因素有哪些?
但最重要的包括:
(1)产品。如果产品毫无吸引力而言,那么获客就是无源之水,无本之末。
(2)区域。这里的区域可是个分公司/网店,通常代表一个收入中心
(3)推广活动。新增客户的爆发增长,与后续衰减都与推广活动密切相关。
(4)渠道。不同渠道来源的客户质量、获可成本差异较大,尤其对于手游、电商等行业,需要对渠道深入开展风险。
产品、区域、推广活动、渠道,都是我们进一步多维度建模时的模型设计基础。让我们先从简单的产品/区域维度开始,稍后再不断地对模型进行扩展分析。
Power BI中可视化图表的选取决策
分析思路:在数据量不是很多的情况下,可以使用柱形图来展现。尤其除了期间以外,我们还想显示出期初/期末时,柱形图更加合适。
同时显示【新增客户数】和【老(回头)客户数】,
如果并排显示,选取簇状柱形图,就是强调对比;
如果堆积显示,选取堆积柱形图,就强调客户构成。
本期活跃客户数=新增客户数+老(回头)客户。
通过逐月查看活跃用户构成的客户数趋势分析,可以清晰地体现出新老客户所占的比例的变化趋势情况。
当然,也可以使用堆积柱形图来查看占比变化,并突出显示自行车品类,占所有产品获客中的比重。
可见2015年下半年的新增获客,主要是通过服装和配件拉动的。
Power BI中可视化图表的渲染决策
对Power BI中图表的可视化渲染,通常的主要考虑因素是颜色和次序:从活跃度上来看,一般有:新增客户>老客户>流失客户。因此排序次序上,活跃度最高的用深色、靠近X轴;不活跃的流失客户数,用浅色,远离X轴。
注:这里是客户数三分法,还可以进一步细分,形成客户四分法,考虑:
【回流客户数】,也就是曾经购买过但流失的客户,又重新回流购买的情况:
老(回头)客户数=【一般的老客户】+ 【回流客户数】。
所以将【新增客户数】数据序列置于底部 ,然后是【老(回头)客户数】,最上方是【流失客户数】,颜色更浅,距离X轴更远。
这里我们不强调本期新增客户数=本期末客户数-上期末客户数=本期末客户数-本期初客户数,并且把新增客户数置于底部。由于期数比较多,因此我们可以使用堆积面积图,来进行可视化展现。
Power BI中可视化图表的交互筛选决策可以是按照哪些维度开展分析和交互?
之前我们谈到,影响获客的长期因素,通常是产品和不同地区的收入中心。短期因素通常是推广促销和渠道。
这里我们先使用产品和国家。这次我们不使用条形图的交叉筛选进行贡献构成分析,而是直接添加一个“国家”切片器,重点查看每个国家地区的获客情况。
不难发现,韩国的获客能力不断下降,而且在2016年4月新增客户数很少。
如果我们进一步查看构成变化趋势,会发现客户流失加剧,迫切需要新增客户并激活现有客户,降低客户流失。
当然,在采取行动之前,我们应当衡量下 CAC (用户获取成本)、LTV(用户的终身价值) 和 PBP(回收期),这三个指标我们稍后再展开。
由于目前可视化图表中尚未提供堆积面积图,因此我们使用堆积柱形图来替代。
通过堆积柱形图的占比,更容易发现这种趋势。
Power BI中可视化图表的组合图表决策
在新增获客中,一个重要的指标,就是客户增长率。
通过使用切片器进行交互式的筛选,很容易看出各个地区、各个产品的客户增长趋势。点击图表的“焦点模式”,很容易全屏查看客户增长情况。
【客户增长率】的计算:
很显然,【客户增长率】的分子,是当期的【新增客户数】,这里的当期,既可以是季度、也可以是月份。
那么分母呢?我们知道,所谓新增客户数,就是本期LTD客户数,减去上期LTD客户数。因此比率所用的分母,就应当是上期(前期)客户数,这样的比较才更有意义。
从之前的季度的新增/回头/流失客户的柱形图上,也很容易看出这一点。
当然,也有分析师使用环比客户增长率,也就是(本期新增客户数-上期新增客户数)/上期新增客户数。
这里暂且不争论。只是思考两个问题。看看该指标是否得到荒谬的效果。
如果上期新增客户数为0 (11月第一周,由于某种原因停业经营了),本期新增客户数为1(双11期间),按照这种方法得到的环比客户增长率为多少?无穷大;
如果上期新增客户数为7亿,本期新增客户数为6亿(中国一共有13亿人口)。那么这种方法得到的环比客户增长率为多少?负增长。
另外,从上图中你可能已经发现,上期客户数,实际上等于 本期回头老客户数+本期流失客户数。
这涉及到AARRR中的客户激活复购回购、客户留存流失分析中的内容,我们将在该系列中进一步分享,请持续关注我在天善智能中的博客专栏 PivotModel 。
以上是我《微软 Power BI 创建 AARRR 报表:新增获客》中的主要内容,所有可视化分析和函数编写,均由微软 Power BI 工具绘制和展现。
欢迎大家参与指标的定义计算、DAX函数的编写,以及Power BI可视化分析技巧的讨论。
给大家留一个小的测试题
通常可以说一切的生意都离不开的这三个词——CAC、LTV、PBP。
CAC 用户获取成本。
LTV 用户的终身价值
PBP 回收期
这三个词的英文全称是什么?可以回复留言在本文章后,给出答案和具体的解释。
(全文完,敬请关注天善智能,关注 PivotModel 博客专栏,点击阅读全文访问)
有关 Power BI 的线上课程请访问 edu.hellobi.com
Friday BI Fly 近两周线上活动预告
7月29日 - 腾讯大数据分析与挖掘应用
8月5日 - 谈谈 BI 在生产企业的建设与应用
天善智能 www.hellobi.com 是一个专注于商业智能BI、数据分析、数据挖掘和大数据技术的垂直社区平台(国内唯一的数据类技术问答社区、博客、在线学院)。
天善智能拥有国内最大的数据领域社群组织,每周五晚上 8:30 Friday BI Fly 30+ 微信群同步直播行业和大数据技术交流。
Saturday BI Fly 北上广深以及全国其它各个城市 200-500人规模的大数据沙龙活动。